Descubre por qué Netskope debutó como Líder en el Cuadrante Mágico de Gartner® 2024 para Secure Access Service Edge (SASE) de Proveedor Único.

Lea cómo los clientes innovadores navegan con éxito por el cambiante panorama actual de las redes y la seguridad a través de la Plataforma Netskope One.

Obtenga el eBook

Más información sobre los socios de Netskope

Grupo de jóvenes profesionales diversos sonriendo

Security Service Edge (SSE), Cloud Access Security Broker (CASB), Cloud Firewall, Next Generation Secure Web Gateway (SWG) y Private Access for ZTNA integrados de forma nativa en una única solución para ayudar a todas las empresas en su viaje hacia la arquitectura Secure Access Service Edge (SASE).

Todos los productos

Netskope Next Gen SASE Branch converge Context-Aware SASE Fabric, Zero-Trust Hybrid Security y SkopeAI-Powered Cloud Orchestrator en una oferta de nube unificada, marcando el comienzo de una experiencia de sucursal completamente modernizada para la empresa sin fronteras.

Obtenga más información sobre Next Gen SASE Branch

Personas en la oficina de espacios abiertos.

Obtenga un ejemplar gratuito del único manual que necesitará sobre diseño de una arquitectura SASE.

Obtenga el eBook

Libro electrónico de arquitectura SASE para principiantes

Más información sobre NewEdge

Autopista iluminada a través de las curvas de la ladera de la montaña

Descubra cómo aseguramos el uso generativo de IA

Habilite de forma segura ChatGPT y IA generativa

Más información sobre Confianza Cero

Elija Netskope GovCloud para acelerar la transformación de su agencia.

Más información sobre Netskope GovCloud

A Cyber & Physical Security Playbook
Emily Wearmouth y Ben Morris exploran los desafíos de proteger eventos deportivos internacionales donde la ciberseguridad se encuentra con la seguridad física.

Reproducir el pódcast Ver todos los podcasts

Un Playbook de Seguridad Cibernética y Física, con Ben Morris de World Rugby

Lea cómo Netskope puede habilitar el viaje hacia Zero Trust y SASE a través de las capacidades de perímetro de servicio de acceso seguro (SASE).

Lea el blog

Aprenda a navegar por los últimos avances en SASE y Zero Trust y explore cómo estos marcos se están adaptando para abordar los desafíos de ciberseguridad e infraestructura

Explorar sesiones

Infórmese sobre la futura convergencia de las herramientas de red y seguridad en el modelo de negocio actual de la nube.

Conozca el SASE

Netskope se enorgullece de participar en Vision 2045: una iniciativa destinada a crear conciencia sobre el papel de la industria privada en la sostenibilidad.

Descubra más

Apoyando la sustentabilidad a través de la seguridad de los datos

En Netskope, los fundadores y líderes trabajan codo con codo con sus colegas, incluso los expertos más renombrados dejan sus egos en la puerta y las mejores ideas ganan.

Únete al equipo

Ir a Soluciones para clientes

Infórmese sobre Capacitaciones y Certificaciones

Grupo de jóvenes profesionales que trabajan

En un abrir y cerrar de ojos de la IA - Cómo la Inteligencia Artificial está cambiando la forma en que las empresas protegen los datos sensibles en las imágenes

Solicite una demostración

Artículo escrito conjuntamente por Yihua Liao y Yi Zhang

Probablemente ha oído hablar de cómo la tecnología de IA se utiliza para reconocer gatos, perros y humanos en imágenes, una tarea conocida como clasificación de imágenes. La misma tecnología que identifica a un gato o un perro - también puede identificar datos sensibles (como tarjetas de identificación y registros médicos) en imágenes que atraviesan su red corporativa. En este artículo, le mostraremos cómo utilizamos las redes neuronales convolucionales (RNC), el aprendizaje por transferencia y las redes generativas antagónicas (RGAs) para proporcionar protección de datos de imágenes a los clientes corporativos de Netskope.

Seguridad de los datos en imágenes

Las imágenes representan más del 25% del tráfico de usuarios corporativos que pasa por la plataforma de Prevención de Fuga de Datos (DLP) de Netskope. Muchas de estas imágenes contienen información sensible, incluyendo información personal (PII) de clientes o empleados (por ejemplo, fotos de pasaportes, licencias/carnets de conducir y tarjetas de crédito), capturas de pantalla de propiedad intelectual y documentos financieros confidenciales. Al detectar información sensible en imágenes, documentos y flujos de tráfico de aplicaciones, ayudamos a las organizaciones al cumplimiento normativo y a proteger sus activos.

El enfoque tradicional para identificar datos sensibles en una imagen ha sido utilizar el reconocimiento óptico de caracteres (OCR) para extraer el texto de la imagen. El texto extraído se utiliza luego para la comparación de patrones. Esta tecnología, aunque eficaz, requiere muchos recursos y retrasa la detección de violaciones de la seguridad. El OCR también tiene dificultades para identificar violaciones en imágenes de baja calidad. En muchos casos, sólo necesitamos determinar la clasificación de la imagen de entrada. Por ejemplo, nos gustaría averiguar si una imagen es una tarjeta de crédito o no, sin saber el número de tarjeta de 16 dígitos y otros detalles de la imagen. La clasificación de imágenes basada en el aprendizaje automático es una opción ideal para ello debido a su precisión, velocidad y capacidad para trabajar en línea con controles granulares de políticas. También podemos combinar la clasificación de imágenes con el OCR para generar alertas de violación más detalladas.

RNC y el aprendizaje por transferencia

El aprendizaje profundo y las redes neuronales convolucionales (RNC) fueron un gran avance en la clasificación de imágenes a principios de la década de 2010. Desde entonces, la clasificación de imágenes basada en las RNC se ha aplicado a muchos dominios diferentes, incluyendo la medicina, los vehículos autónomos y la seguridad, con una precisión cercana a la de los humanos. Inspirada en el funcionamiento de la corteza visual humana, una RNC es capaz de capturar eficazmente las formas, objetos y otras cualidades para comprender mejor el contenido de la imagen. Una RNC típica tiene dos partes (representadas en el gráfico de abajo):

La base convolucional, que consiste en una pila de capas convolucionales y de agrupamiento. El objetivo principal de la base convolucional es generar características de la imagen. Construye progresivamente características de nivel superior a partir de una imagen de entrada. Las primeras capas se refieren a características generales, como bordes, líneas y puntos en la imagen. Mientras tanto, las últimas capas se refieren a características específicas de la tarea, que son más interpretables por el ser humano, como el logotipo de una tarjeta de crédito, o las ventanas de la aplicación en una captura de pantalla.
El clasificador, que suele estar compuesto de capas totalmente conectadas. Piense en el clasificador como una máquina que clasifica las características identificadas en la base convolucional. El clasificador le dirá si los rasgos identificados son un gato, un perro, una licencia/carné de conducir o una radiografía.

Diagrama de CNN y transferencia de aprendizaje — Fuente de la imagen: DOI: 10.3390/electronics8030292

Puede que necesite millones de imágenes etiquetadas para entrenar a una RNC desde el principio para conseguir una precisión de clasificación de última generación. No es trivial recoger un gran número de imágenes con etiquetas adecuadas, especialmente cuando se trata de datos sensibles como pasaportes y tarjetas de crédito. Afortunadamente, podemos utilizar el aprendizaje por transferencia, una técnica popular de aprendizaje profundo, para entrenar una red neuronal con sólo cientos o miles de muestras de entrenamiento. Con el aprendizaje por transferencia, podemos aprovechar una red neural convolucional existente (por ejemplo, ResNet o MobileNet) que fue entrenada en un gran conjunto de datos para clasificar otros objetos, y ajustarla para entrenar con imágenes adicionales. El aprendizaje por transferencia nos permite entrenar un clasificador de imágenes de la RNC con un conjunto de datos limitado y aun así lograr un buen rendimiento mientras se reduce significativamente el tiempo de entrenamiento.

Generación de datos sintéticos de entrenamiento

Es muy difícil adquirir imágenes reales para categorías tan sensibles como las que nos interesan. Para aumentar la cantidad y diversidad del conjunto de datos de entrenamiento y mejorar aún más la precisión de los clasificadores de la RNC, utilizamos redes generativas antagónicas (RGAs) para generar datos sintéticos de entrenamiento. La idea básica de una RGA es crear dos redes neuronales que compiten entre sí (diagrama de arquitectura de alto nivel más abajo). Una red neuronal, llamada el generador, genera datos falsos, mientras que la otra, el discriminador, los evalúa en cuanto a su autenticidad. El objetivo es generar datos similares a los datos de entrenamiento y engañar al discriminador.

Diagrama de GAN — Fuente de la imagen: Redes Generativas Antagónicas Convolucionales Profundas

Con una RGA, somos capaces de sintetizar imágenes fotorrealistas con diferentes grados de cambio en la rotación, color, desenfoque, fondo, etc. Aquí hay algunos ejemplos de las imágenes sintéticas:

Los clasificadores de imagen DLP en línea de Netskope

En Netskope hemos desarrollado clasificadores de imagen basados en las RNCs, como parte de nuestro SWG de Nueva Generación y de nuestras soluciones en línea en la nube que cubren aplicaciones gestionadas, aplicaciones no gestionadas, aplicaciones personalizadas y tráfico de usuarios de servicios en nube pública. Los clasificadores son capaces de identificar con precisión imágenes con información sensible, incluyendo pasaportes, licencias/carnets de conducir, tarjetas de seguridad social de EE.UU., tarjetas de crédito y tarjetas de débito, capturas de pantalla a pantalla completa y de aplicaciones, etc. Los clasificadores en línea proporcionan controles granulares de políticas en tiempo real.

Ejemplos de pasaportes, licencias de conducir, números de seguro social y tarjetas de crédito/débito

Trabajos futuros

En Netskope, estamos ampliando activamente nuestro portfolio de clasificadores de imagen en línea con la última tecnología de visión artificial. También tenemos la capacidad de entrenar clasificadores personalizados e identificar nuevos tipos de imágenes que nuestros clientes están interesados en clasificar. Si su organización tiene activos específicos que pueden ser compartidos en imágenes y le gustaría proteger esos activos, póngase en contacto con nosotros en [email protected] para obtener más información

Yihua Liao

El Dr. Yihua Liao es el Jefe de AI Labs en Netskope. Su equipo desarrolla tecnología de IA/ML de vanguardia para abordar muchos problemas desafiantes en la seguridad en la nube.

Lea más

Más artículos de Yihua Liao

Leer biografía completa

Más artículos